04. Pre-Notebook:Word2Vec,SkipGram

Notebook:Word2Vec SkipGram 模型

下面的几个视频将介绍如何使用 SkipGram 结构实现 Word2Vec 模型。

建议使用当前标签页观看课程,同时用新标签页打开 notebook,边学习边操作。这样可以一边学习新技能,一边编写代码/运用新技能。

打开 notebook 的方法:

  • 直接在课堂里在线打开(推荐)
  • Github 克隆代码库,再打开 word2vec-embeddings 文件夹里的 notebook Skip_Grams_Exercise.ipynb。你可以使用 git clone https://github.com/udacity/deep-learning-v2-pytorch.git 下载代码库,或从此链接下载归档文件。

说明

  • 加载文本数据
  • 预处理数据,用整数表示字符
  • 定义目标字词的上下文字词
  • 定义一个 RNN,它会根据某个输入字词预测上下文字词
  • 训练该 RNN
  • 可视化在嵌入层中学习的嵌入向量

这是一个自我评估 Lab。如果你需要帮助或想参考答案,请查看同一文件夹里的 solution notebook,或点击此处

GPU Workspace

下个 workspace 支持 GPU,所以你可以选择在 GPU 实例上训练模型。建议做法:

  • 在 CPU 模式(非启用模式)下加载数据、测试函数和模型(检查参数并执行简短的训练循环)
  • 准备好大规模地训练和测试模型时,启用 GPU 以快速训练模型

强烈建议训练时间不超过 1-2 个周期。

当做输入的所有模型和数据都必须移到 GPU 设备上,所以请注意模型创建和训练流程中的相关移动代码。